06 概念、语言与高层思维

Concepts, Language, and High-Level Thinking 概念、语言与高层思维

我们之所以与灵长类近亲截然不同，最关键的区别在于高级认知功能。我们的视觉和听觉与猴子相差无几，但只有人类使用复杂语言、制造计算机这样的复杂工具，并且能够推理进化、遗传学和民主这类抽象概念。

Vernon Mountcastle 提出，新皮层中每一根皮层柱（cortical column）都执行相同的基本功能。如果这是对的，那么语言和其他高级认知能力在某个根本层面上，与视觉、触觉和听觉是一回事。这并不显而易见——阅读莎士比亚看起来和拿起一杯咖啡毫无相似之处，但这正是 Mountcastle 假说的推论。

Mountcastle 知道皮层柱并非完全相同。比如，处理手指输入的皮层柱和理解语言的皮层柱之间确实存在物理差异，但相似之处远多于差异。因此他推断，一定存在某种基本功能贯穿新皮层所做的一切——不仅是感知，还包括我们所认为的智能的全部内容。

视觉、触觉、语言和哲学这些看似迥异的能力在本质上相同——这个想法很多人难以接受。Mountcastle 没有提出这个共同功能是什么，也很难想象它可能是什么，所以人们很容易忽视或直接否定他的假说。例如，语言学家常常把语言描述为与所有其他认知能力不同的东西。如果他们接受 Mountcastle 的假说，或许会去寻找语言与视觉之间的共性，从而更好地理解语言。对我来说，这个想法太令人兴奋了，不容忽视，而且我发现经验证据压倒性地支持 Mountcastle 的假说。因此，我们面对一个迷人的谜题：什么样的功能或算法，能够创造人类智能的所有方面？

到目前为止，我描述了一个理论：皮层柱如何学习咖啡杯、椅子和智能手机等物理对象的模型。该理论认为，皮层柱为每个观察到的对象创建参考框架（reference frame）。回忆一下，参考框架就像一个不可见的三维网格，围绕并附着在某个事物上。参考框架允许皮层柱学习定义对象形状的各个特征的位置。

更抽象地说，我们可以把参考框架看作一种组织任何类型知识的方式。咖啡杯的参考框架对应一个可以触摸和看到的物理对象。然而，参考框架也可以用来组织我们无法直接感知的事物的知识。

想想你所知道的那些从未直接经历过的事物。例如，如果你学过遗传学，你就知道 DNA 分子。你能想象它们的双螺旋形状，知道它们如何用核苷酸的 ATCG 编码来编码氨基酸序列，也知道 DNA 分子如何通过"拉链式"解开来复制。当然，没有人真正直接看到或触摸过 DNA 分子——它们太小了。为了组织关于 DNA 分子的知识，我们画出图片，仿佛能看到它们；制作模型，仿佛能触摸它们。这使我们能够将 DNA 分子的知识存储在参考框架中——就像存储咖啡杯的知识一样。

我们对很多知识都使用这个技巧。例如，我们对光子了解很多，对银河系也了解很多。我们再次把它们想象成可以看到和触摸的东西，因此可以用与日常物理对象相同的参考框架机制来组织关于它们的事实。但人类知识延伸到无法可视化的领域。例如，我们拥有关于民主、人权和数学等概念的知识。我们知道关于这些概念的许多事实，但无法以类似三维对象的方式来组织这些事实。你很难为"民主"画一幅图。

但概念性知识一定存在某种组织形式。民主和数学这样的概念不仅仅是一堆事实的堆砌。我们能够对它们进行推理，预测如果我们采取某种行动会发生什么。这种能力告诉我们，概念知识也一定存储在参考框架中。但这些参考框架可能不容易等同于我们用于咖啡杯和其他物理对象的参考框架。例如，对某些概念最有用的参考框架可能具有超过三个维度。我们无法可视化超过三维的空间，但从数学角度来看，它们的工作方式与三维或更低维度的空间相同。

所有知识都存储在参考框架中

本章探讨的假说是：大脑使用参考框架来安排所有知识，而思考是一种移动形式。当我们激活参考框架中的连续位置时，思考就发生了。

这个假说可以分解为以下几个组成部分。

1. 参考框架存在于新皮层的每个地方

这个前提指出，新皮层中的每一根皮层柱都拥有创建参考框架的细胞。我提出，执行这一功能的细胞类似于（但不完全等同于）大脑较古老部分中发现的网格细胞（grid cells）和位置细胞（place cells）。

2. 参考框架用于建模我们所知的一切，而不仅仅是物理对象

新皮层中的一根皮层柱不过是一堆神经元。皮层柱并不"知道"它的输入代表什么，也没有关于自己应该学什么的先验知识。皮层柱只是一个由神经元构建的机制，盲目地试图发现和建模导致其输入变化的事物的结构。

此前我提出，大脑最初进化出参考框架是为了学习环境的结构，以便我们能在世界中移动。然后大脑进化为使用相同的机制来学习物理对象的结构，以便我们能识别和操纵它们。现在我进一步提出，大脑再次进化为使用同样的机制来学习和表征概念性对象的底层结构，比如数学和民主。

3. 所有知识都存储在参考框架的相对位置上

参考框架不是智能的可选组件；它们是大脑中所有信息存储的结构。你所知道的每一个事实都与参考框架中的一个位置配对。要成为历史等领域的专家，就需要将历史事实分配到适当参考框架中的位置。

以这种方式组织知识使事实变得可操作。回忆一下地图的类比。通过将关于一个城镇的事实放置到网格状的参考框架上，我们可以确定实现目标所需的行动，比如如何到达某家餐厅。地图的均匀网格使关于城镇的事实变得可操作。这个原则适用于所有知识。

4. 思考是一种移动形式

如果我们所知的一切都存储在参考框架中，那么要回忆存储的知识，我们就必须激活适当参考框架中的适当位置。当神经元在参考框架中逐个激活位置、唤起每个位置存储的内容时，思考就发生了。我们在思考时经历的思绪接续，类似于用手指触摸物体时经历的感觉接续，或者在城镇中行走时看到的事物接续。

参考框架也是实现目标的手段。正如纸质地图让你能够规划从当前位置到目标位置的路线，新皮层中的参考框架让你能够规划实现更概念性目标的步骤，比如解决工程问题或在工作中获得晋升。

虽然我们在一些已发表的研究中提到了这些关于概念知识的想法，但它们并非重点，我们也没有直接就这个主题发表论文。所以你可以认为本章比本书前面的部分更具推测性，但我并不这么觉得。虽然有很多细节我们尚未理解，但我确信整体框架——概念和思考基于参考框架——将经受住时间的考验。

在本章的其余部分，我将首先描述新皮层的一个被充分研究的特征：它被划分为"什么"区域和"哪里"区域。我用这个讨论来展示皮层柱如何通过简单改变参考框架来执行截然不同的功能。然后我转向更抽象和概念性的智能形式。我将呈现支持上述前提的实验证据，并举例说明该理论如何与三个主题相关：数学、政治和语言。

"什么"通路与"哪里"通路

你的大脑有两套视觉系统。如果沿着视神经从眼睛追踪到新皮层，你会看到它通向两条平行的视觉系统，分别称为 "什么"视觉通路（what visual pathway）和 "哪里"视觉通路（where visual pathway）。

"什么"通路是一组从大脑最后方开始、向两侧延伸的皮层区域。
"哪里"通路同样从大脑后方开始，但向顶部延伸。

"什么"和"哪里"视觉系统在五十多年前就被发现了。多年后，科学家意识到其他感官也存在类似的平行通路——视觉、触觉和听觉都有各自的"什么"和"哪里"区域。

这两条通路扮演互补角色。例如，如果我们禁用"哪里"视觉通路，那么一个人看着物体时能告诉你那是什么，但无法伸手去拿。他们知道自己看到的是一个杯子，但奇怪的是，说不出杯子在哪里。如果反过来禁用"什么"视觉通路，那么这个人可以伸手抓住物体——他们知道它在哪里，但无法辨认那是什么。（至少视觉上无法辨认。当手触碰到物体时，他们可以通过触觉来识别。）

"什么"区域和"哪里"区域的皮层柱看起来很相似，具有相似的细胞类型、层次和回路。那么它们为什么会有不同的功能？是什么差异导致了它们不同的角色？你可能会倾向于假设两类皮层柱在功能上存在某种差异——也许"哪里"柱多了几种额外的神经元类型或层间连接不同。你可能承认它们看起来相似，但认为可能存在某种我们尚未发现的物理差异。如果你持这种立场，那你就是在否定 Mountcastle 的假说。

但我们不必放弃 Mountcastle 的前提。我们提出了一个简单的解释：为什么有些皮层柱是"什么"柱，有些是"哪里"柱。"什么"柱中的皮层网格细胞将参考框架附着到对象上；"哪里"柱中的皮层网格细胞将参考框架附着到你的身体上。

如果一根"哪里"视觉柱能说话，它可能会说："我创建了一个附着在身体上的参考框架。利用这个参考框架，我看着一只手，知道它相对于身体的位置。然后我看着一个物体，知道它相对于身体的位置。有了这两个位置——都在身体的参考框架中——我可以计算如何将手移向物体。我知道物体在哪里以及如何去够它，但我无法辨认它是什么。"
如果一根"什么"视觉柱能说话，它可能会说："我创建了一个附着在对象上的参考框架。利用这个参考框架，我可以将这个对象识别为一个咖啡杯。我知道它是什么，但不知道它在哪里。"两者协同工作，使我们能够识别物体、伸手去拿并操纵它们。

为什么一根皮层柱（柱 A）会将参考框架附着到外部对象，而另一根（柱 B）会附着到身体？原因可能很简单：取决于输入来自哪里。

如果柱 A 从对象获得感觉输入（比如手指触摸杯子的感觉），它会自动创建一个锚定在对象上的参考框架。
如果柱 B 从身体获得输入（比如检测肢体关节角度的神经元），它会自动创建一个锚定在身体上的参考框架。

从某种意义上说，你的身体只是世界中的另一个对象。新皮层用与建模咖啡杯相同的基本方法来建模你的身体。然而，与外部对象不同，你的身体始终存在。新皮层中相当大的比例——"哪里"区域——专门用于建模你的身体和身体周围的空间。

大脑包含身体地图这个想法并不新鲜，肢体运动需要以身体为中心的参考框架这个想法也不新鲜。我想强调的是：看起来和运作方式相似的皮层柱，可以因为参考框架锚定对象的不同而表现出不同的功能。有了这个认识，将参考框架应用于概念就不是什么大的跳跃了。

概念的参考框架

到目前为止，我描述的都是大脑如何学习具有物理形状的事物的模型。订书机、手机、DNA 分子、建筑物和你的身体都有物理存在。这些都是我们可以直接感知的事物，或者——如 DNA 分子的情况——可以想象感知的事物。

然而，我们关于世界的很多知识无法直接感知，也可能没有任何物理对应物。例如，我们无法伸手触摸民主或素数这样的概念，但我们对它们了解很多。皮层柱如何为无法感知的事物创建模型？

诀窍在于，参考框架不必锚定在物理事物上。民主这样的概念的参考框架需要自洽，但可以相对独立于日常物理事物而存在。这类似于我们可以为虚构的土地创建地图——虚构土地的地图需要自洽，但不需要位于地球上的任何特定位置。

第二个诀窍是，概念的参考框架不必具有与咖啡杯等物理对象的参考框架相同数量或类型的维度。城镇中建筑物的位置最好用二维描述。咖啡杯的形状最好用三维描述。但参考框架赋予我们的所有能力——比如确定两个位置之间的距离、计算如何从一个位置移动到另一个位置——在四维或更多维度的参考框架中同样存在。

如果你难以理解超过三维的事物，考虑这个类比。假设我想创建一个参考框架来组织关于我认识的所有人的知识。一个维度可以是年龄——我可以按年龄排列我的熟人。另一个指标可以是他们相对于我住在哪里，这需要再加两个维度。另一个维度可以是我多久见他们一次，或者他们有多高。这就已经有五个维度了。这只是一个类比，不一定是新皮层实际使用的维度。但我希望你能看到超过三个维度如何可能是有用的。

皮层柱很可能没有关于应该使用什么类型参考框架的预设概念。当一根皮层柱学习某事物的模型时，学习的一部分就是发现什么是好的参考框架，包括维度的数量。

现在，我将回顾支持上面列出的四个前提的经验证据。这是一个实验证据不太多的领域，但确实有一些，而且在不断增长。

位置记忆法

一种著名的记忆技巧叫做位置记忆法（method of loci），有时也称为"记忆宫殿"。方法是想象把你要记住的项目放在你家中的不同位置。要回忆这些项目时，你想象自己走过家中各处，这会逐一唤起每个项目的记忆。这个记忆技巧的成功告诉我们：当信息被分配到一个熟悉的参考框架中的位置时，回忆会更容易。在这个例子中，参考框架就是你家的心理地图。注意，回忆的行为是通过移动实现的——你并没有物理移动身体，而是在心理上穿行于你的房子。

位置记忆法支持上述两个前提：信息存储在参考框架中，信息的检索是一种移动形式。这个方法对快速记忆一系列项目（比如一组随机名词）很有用。它之所以有效，是因为它将项目分配到一个先前学习过的参考框架（你的房子）中，并使用先前学习过的移动方式（你通常在家中的行走路线）。然而，大多数时候学习时，你的大脑会创建新的参考框架。接下来我们会看到一个例子。

使用 fMRI 的人类研究

功能性磁共振成像（fMRI）是一种观察活体大脑、查看哪些部分最活跃的技术。你可能见过 fMRI 图像：它们显示大脑轮廓，某些部分被标为黄色和红色，表示拍摄图像时能量消耗最多的区域。fMRI 通常用于人类受试者，因为这个过程需要在一台大型嘈杂机器的狭窄管道中完全静止地躺着，同时执行特定的心理任务。通常，受试者会看着电脑屏幕，同时听从研究者的口头指令。

fMRI 的发明对某些类型的研究是一大福音，但对我们所做的研究通常不太有用。我们的新皮层理论研究依赖于知道哪些单个神经元在任何时间点是活跃的，而活跃的神经元每秒变化数次。有实验技术可以提供这类数据，但 fMRI 不具备我们通常需要的空间和时间精度。fMRI 测量的是许多神经元的平均活动，无法检测持续时间少于约一秒的活动。

因此，当我们得知 Christian Doeller、Caswell Barry 和 Neil Burgess 设计的一个巧妙 fMRI 实验证明网格细胞存在于新皮层中时，我们既惊讶又兴奋。细节很复杂，但研究者意识到网格细胞可能表现出一种可以用 fMRI 检测到的特征信号。他们首先必须验证技术是否有效，于是观察了已知存在网格细胞的内嗅皮层。他们让人类受试者执行在电脑屏幕上的虚拟世界中导航的任务，使用 fMRI 成功检测到了受试者执行任务时的网格细胞活动。然后他们将注意力转向新皮层。他们用 fMRI 技术观察受试者执行相同导航任务时新皮层前额区域的活动，发现了相同的特征信号，强烈表明网格细胞也存在于新皮层的至少某些部分。

另一个科学家团队——Alexandra Constantinescu、Jill O'Reilly 和 Timothy Behrens——将这种新的 fMRI 技术用于不同的任务。受试者被展示鸟类图像，这些鸟的脖子长度和腿长度各不相同。受试者被要求执行与鸟类相关的各种心理意象任务，比如想象一只结合了两只先前看到的鸟的特征的新鸟。实验不仅表明网格细胞存在于新皮层前额区域，研究者还发现证据表明新皮层将鸟类图像存储在一个类似地图的参考框架中——一个维度代表脖子长度，另一个代表腿长度。研究团队进一步表明，当受试者思考鸟类时，他们在心理上"移动"穿过鸟类地图，就像你可以在心理上穿行于你家的地图一样。这个实验的细节很复杂，但 fMRI 数据表明新皮层的这个部分使用了类似网格细胞的神经元来学习鸟类。参与实验的受试者完全没有意识到这正在发生，但成像数据很清楚。

位置记忆法使用一个先前学习的地图——你家的地图——来存储项目以便日后回忆。在鸟类的例子中，新皮层创建了一个新地图，一个适合记忆具有不同脖子和腿的鸟类的地图。在两个例子中，将项目存储在参考框架中并通过"移动"来回忆的过程是相同的。

概念性知识与参考框架

如果所有知识都以这种方式存储，那么我们通常所说的思考实际上是在一个空间中移动，穿过一个参考框架。你当前的想法——任何时刻在你脑中的东西——由参考框架中的当前位置决定。随着位置改变，存储在每个位置的项目被逐一回忆。我们的思绪不断变化，但并非随机。我们接下来想什么取决于我们在参考框架中向哪个方向心理移动，就像我们在城镇中接下来看到什么取决于我们从当前位置向哪个方向移动。

学习咖啡杯所需的参考框架也许是显而易见的：就是杯子周围的三维空间。fMRI 鸟类实验中学习的参考框架也许不那么明显，但仍然与鸟类的物理属性（如腿和脖子）相关。但大脑应该为经济学或生态学这样的概念使用什么样的参考框架？可能有多种参考框架可行，尽管有些可能比其他的更好。

这就是学习概念性知识可能很困难的原因之一。如果我给你十个与民主相关的历史事件，你应该如何排列它们？一位老师可能把事件排列在时间线上。时间线是一维参考框架，有助于评估事件的时间顺序以及哪些事件可能因时间接近而存在因果关系。另一位老师可能把相同的历史事件按地理位置排列在世界地图上。地图参考框架暗示了对相同事件的不同思考方式，比如哪些事件可能因空间接近、或因靠近海洋、沙漠或山脉而存在因果关系。时间线和地理都是组织历史事件的有效方式，但它们导致对历史的不同思考方式，可能得出不同的结论和不同的预测。学习民主的最佳结构可能需要一张全新的地图——一张具有多个抽象维度的地图，对应公平或权利。我并不是说"公平"或"权利"是大脑实际使用的维度。我的观点是，成为某个研究领域的专家需要发现一个好的框架来表征相关的数据和事实。可能不存在一个"正确的"参考框架，两个人可能会以不同方式排列事实。发现一个有用的参考框架是学习中最困难的部分，尽管大多数时候我们并没有意识到这一点。我将用前面提到的三个例子来说明这个想法：数学、政治和语言。

数学

假设你是一位数学家，想要证明 OMG 猜想（OMG 不是一个真实的猜想）。猜想是一个被认为是正确的但尚未被证明的数学陈述。要证明一个猜想，你从已知为真的东西出发，然后应用一系列数学运算。如果通过这个过程你到达了一个就是该猜想的陈述，那么你就成功证明了它。通常会有一系列中间结果。例如，从 A 出发证明 B，从 B 证明 C，最后从 C 证明 OMG。假设 A、B、C 和最终的 OMG 都是方程。要从一个方程到达另一个方程，你必须执行一个或多个数学运算。

现在假设这些方程在你的新皮层中被表征在一个参考框架中。数学运算（如乘法或除法）是将你带到参考框架中不同位置的移动。执行一系列运算将你移动到一个新位置——一个新方程。如果你能确定一组运算——在方程空间中的移动——使你从 A 到达 OMG，那么你就成功证明了 OMG。

解决复杂问题（如数学猜想）需要大量训练。学习一个新领域时，你的大脑不仅仅是在存储事实。对于数学，大脑必须发现有用的参考框架来存储方程和数字，还必须学习数学行为（如运算和变换）如何在参考框架内移动到新位置。

对数学家来说，方程是熟悉的对象，就像你我看到智能手机或自行车一样。当数学家看到一个新方程时，他们认出它与之前处理过的方程相似，这立即暗示了如何操纵新方程以达到某些结果。这与我们看到一部新智能手机时的过程相同——我们认出这部手机与我们用过的其他手机相似，这暗示了如何操纵新手机以达到期望的结果。

然而，如果你没有受过数学训练，方程和其他数学符号看起来就像无意义的涂鸦。你甚至可能认出一个方程是你以前见过的，但没有参考框架，你就不知道如何操纵它来解决问题。你可能迷失在数学空间中，就像没有地图时迷失在森林中一样。

数学家操纵方程、探险家穿越森林、手指触摸咖啡杯——所有这些都需要类似地图的参考框架来知道自己在哪里，以及需要执行什么移动才能到达想去的地方。相同的基本算法支撑着这些以及我们执行的无数其他活动。

政治

上面的数学例子完全是抽象的，但对于任何不明显是物理性的问题，过程都是一样的。例如，假设一位政治家想要推动一项新法律的颁布。他们已经写好了法律的初稿，但要达到颁布的最终目标还需要多个步骤。途中有政治障碍，所以政治家思考他们可能采取的所有不同行动。一位经验丰富的政治家知道如果召开新闻发布会、强制举行公投、撰写政策文件或提出交换支持另一项法案，可能会发生什么。一位熟练的政治家已经学会了政治的参考框架。参考框架的一部分是政治行动如何改变参考框架中的位置，政治家想象如果他们做这些事情会发生什么。他们的目标是找到一系列行动，引导他们到达期望的结果：颁布新法律。

政治家和数学家都没有意识到自己在使用参考框架来组织知识，就像你我没有意识到我们使用参考框架来理解智能手机和订书机一样。我们不会到处问："有人能建议一个参考框架来组织这些事实吗？" 我们会说的是："我需要帮助，我不理解如何解决这个问题。"或者"我很困惑，你能教我怎么用这个东西吗？"或者"我迷路了，你能告诉我怎么去食堂吗？"这些都是当我们无法为面前的事实分配参考框架时会问的问题。

语言

语言可以说是将人类与所有其他动物区分开来的最重要的认知能力。没有通过语言分享知识和经验的能力，现代社会的大部分都不可能存在。

尽管关于语言已经写了很多卷著作，但据我所知，没有人尝试解释语言是如何由大脑中观察到的神经回路创造的。语言学家通常不涉足神经科学，虽然一些神经科学家研究与语言相关的大脑区域，但他们一直无法提出关于大脑如何创造和理解语言的详细理论。

关于语言是否与其他认知能力根本不同，存在持续的争论。语言学家倾向于认为如此——他们将语言描述为一种独特的能力，与我们做的任何其他事情都不同。如果这是真的，那么创造和理解语言的大脑部分应该看起来不同。在这一点上，神经科学的证据是模棱两可的。

新皮层中有两个中等大小的区域被认为负责语言。韦尼克区（Wernicke's area）被认为负责语言理解，布罗卡区（Broca's area）被认为负责语言产生。这有些简化。首先，关于这些区域的确切位置和范围存在分歧。其次，韦尼克区和布罗卡区的功能并非整齐地分为理解和产生，它们有些重叠。最后——这应该是显而易见的——语言不可能被隔离在新皮层的两个小区域中。我们使用口语、书面语和手语。韦尼克区和布罗卡区不直接从感觉器官获得输入，所以语言理解必须依赖听觉和视觉区域，语言产生必须依赖不同的运动能力。新皮层的大片区域都需要参与创造和理解语言。韦尼克区和布罗卡区扮演关键角色，但认为它们孤立地创造语言是错误的。

关于语言有一件令人惊讶的事——也是暗示语言可能与其他认知功能不同的一点——布罗卡区和韦尼克区只在大脑左侧。右侧的对应区域只与语言有微弱关联。新皮层做的几乎所有其他事情都在大脑两侧进行。语言的这种独特不对称性暗示布罗卡区和韦尼克区有某些不同之处。

为什么语言只在大脑左侧可能有一个简单的解释。一种假说是语言需要快速处理，而新皮层大部分区域的神经元太慢，无法处理语言。韦尼克区和布罗卡区的神经元已知具有额外的绝缘层（称为髓鞘，myelin），使它们能够更快地运行以跟上语言的需求。与新皮层其他部分相比还有其他明显差异。例如，有报告称语言区域的突触数量和密度大于右侧对应区域。但拥有更多突触并不意味着语言区域执行不同的功能——它可能只是意味着这些区域学到了更多东西。

尽管存在一些差异，韦尼克区和布罗卡区的解剖结构再次与新皮层其他区域相似。我们今天掌握的事实表明，虽然这些语言区域有些不同（也许是以微妙的方式），但层次、连接性和细胞类型的整体结构与新皮层其余部分相似。因此，语言底层的大部分机制很可能与认知和感知的其他部分共享。在被证明不是这样之前，这应该是我们的工作假设。因此我们可以问：皮层柱的建模能力（包括参考框架）如何为语言提供基础？

根据语言学家的说法，语言的一个定义性属性是其嵌套结构（nested structure）。例如，句子由短语组成，短语由词组成，词由字母组成。递归（recursion）——反复应用规则的能力——是另一个定义性属性。递归允许句子以几乎无限的复杂度构建。例如，简单句"Tom asked for more tea"可以扩展为"Tom, who works at the auto shop, asked for more tea"，又可以扩展为"Tom, who works at the auto shop, the one by the thrift store, asked for more tea"。递归在语言中的确切定义存在争议，但一般概念不难理解。句子可以由短语组成，短语可以由其他短语组成，如此往复。长期以来，嵌套结构和递归被认为是语言的关键属性。

然而，嵌套和递归结构并非语言独有。事实上，世界上的一切都以这种方式组成。拿我那个印有 Numenta 标志的咖啡杯来说。杯子具有嵌套结构：它由一个圆柱体、一个把手和一个标志组成。标志由一个图形和一个词组成。图形由圆和线组成，而"Numenta"这个词由音节组成，音节本身由字母组成。对象也可以具有递归结构。例如，想象 Numenta 标志中包含一张咖啡杯的图片，杯子上印着 Numenta 标志的图片，标志中又有一张咖啡杯的图片，如此无限。

在我们研究的早期，我们就意识到每根皮层柱必须能够学习嵌套和递归结构。这是学习咖啡杯等物理事物的结构以及数学和语言等概念性事物的结构所必需的约束。我们提出的任何理论都必须解释皮层柱如何做到这一点。

想象一下，过去某个时候你学会了咖啡杯的样子，过去某个时候你学会了 Numenta 标志的样子。但你从未见过标志印在咖啡杯上。现在我给你看一个侧面印有标志的新咖啡杯。你可以很快学会这个新的组合对象，通常只需看一两眼。注意，你不需要重新学习标志或杯子。我们关于杯子和标志的所有知识立即被包含为新对象的一部分。

这是如何发生的？在一根皮层柱内，先前学习的咖啡杯由一个参考框架定义。先前学习的标志也由一个参考框架定义。要学习带有标志的咖啡杯，皮层柱创建一个新的参考框架，在其中存储两样东西：一个指向先前学习的杯子参考框架的链接，和一个指向先前学习的标志参考框架的链接。大脑可以快速完成这一操作，只需几个额外的突触。这有点像在文本文档中使用超链接。想象我写了一篇关于亚伯拉罕·林肯的短文，提到他发表了一篇著名演讲叫葛底斯堡演说。通过将"葛底斯堡演说"变成指向全文的链接，我可以将演讲的所有细节包含在我的文章中，而不必重新输入。

此前我说过皮层柱在参考框架的位置上存储特征。"特征"这个词有些模糊，现在我要更精确。皮层柱为它们知道的每个对象创建参考框架。然后参考框架被填充上指向其他参考框架的链接。大脑使用填充了参考框架的参考框架来建模世界——一路到底都是参考框架。在我们 2019 年的"Frameworks"论文中，我们提出了神经元可能如何做到这一点。

要完全理解新皮层所做的一切，我们还有很长的路要走。但每根皮层柱使用参考框架建模对象这个想法，据我们所知，与语言的需求是一致的。也许在未来我们会发现需要某些特殊的语言回路，但目前情况并非如此。

专业知识

到现在为止，我已经介绍了参考框架的四种用途：一种在旧脑中，三种在新皮层中。

旧脑中的参考框架学习环境的地图。
新皮层"什么"柱中的参考框架学习物理对象的地图。
新皮层"哪里"柱中的参考框架学习身体周围空间的地图。
最后，新皮层非感觉柱中的参考框架学习概念的地图。

要成为任何领域的专家，都需要拥有一个好的参考框架、一张好的地图。两个人观察同一个物理对象很可能最终得到相似的地图。例如，很难想象两个人观察同一把椅子时，大脑会以不同方式排列其特征。但在思考概念时，两个人从相同的事实出发可能最终得到不同的参考框架。回忆一下历史事实列表的例子——一个人可能把事实排列在时间线上，另一个人可能把它们排列在地图上。相同的事实可以导致不同的模型和不同的世界观。

成为专家主要是关于找到一个好的参考框架来排列事实和观察。阿尔伯特·爱因斯坦与他的同时代人从相同的事实出发。然而，他找到了一种更好的排列方式——一个更好的参考框架——使他能够看到类比并做出令人惊讶的预测。关于爱因斯坦的狭义相对论发现，最令人着迷的是他用来做出这些发现的参考框架是日常物体。他思考火车、人和手电筒。他从科学家的经验观察（如光速的绝对性）出发，使用日常参考框架推导出狭义相对论的方程。正因如此，几乎任何人都能跟随他的逻辑并理解他是如何做出发现的。相比之下，爱因斯坦的广义相对论需要基于称为场方程的数学概念的参考框架，这些不容易与日常物体联系起来。爱因斯坦发现这要难理解得多，几乎所有其他人也是如此。

1978 年，当 Vernon Mountcastle 提出感知和认知背后存在一个共同算法时，很难想象什么算法能够强大且通用到满足这一要求。很难想象一个单一过程能解释我们认为的智能的一切——从基本的感觉知觉到最高级、最令人钦佩的智力能力形式。现在对我来说很清楚，共同的皮层算法基于参考框架。参考框架提供了学习世界结构的基础——事物在哪里，它们如何移动和变化。参考框架不仅能为我们可以直接感知的物理对象做到这一点，还能为我们看不到或感觉不到的对象，甚至为没有物理形式的概念做到这一点。

你的大脑有 150,000 根皮层柱。每根皮层柱都是一台学习机器。每根皮层柱通过观察输入如何随时间变化来学习其输入的预测模型。皮层柱不知道自己在学什么，不知道自己的模型代表什么。整个事业及其产生的模型都建立在参考框架之上。理解大脑如何工作的正确参考框架，就是参考框架本身。